AI资讯新闻榜单内容搜索-Agentic Co

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Agentic Co
花了1000倍的token,效果可能却没有更好:AI Agent的“隐性账单”长什么样

花了1000倍的token,效果可能却没有更好:AI Agent的“隐性账单”长什么样

花了1000倍的token,效果可能却没有更好:AI Agent的“隐性账单”长什么样

如今的 AI Agent 正在大规模落地,其中应用最广且最受关注的当数 Claude Code,Codex,Cursor 这类 coding agent。过去的一年里,这类 coding agent 产品迭代迅速,在一年内将在 swe-bench- verified 的准确率提高到了 78%+。

来自主题: AI技术研报
6453 点击    2026-05-19 10:00
DeepSeek V4 发布,全网最细解读 & 技术报告拆解

DeepSeek V4 发布,全网最细解读 & 技术报告拆解

DeepSeek V4 发布,全网最细解读 & 技术报告拆解

Agentic Coding 评测里 V4-Pro 已经到当前开源最佳水平。DeepSeek 公司内部已经把 V4 作为默认编码模型,反馈是优于 Sonnet 4.5,交付质量接近 Opus 4.6 的非思考模式,和 Opus 4.6 的思考模式还有差距。这次还专门为 Claude Code、OpenClaw、OpenCode、CodeBuddy

来自主题: AI技术研报
9321 点击    2026-04-24 16:28
不止修bug:Agentic Coding评测走向复杂feature交付新阶段

不止修bug:Agentic Coding评测走向复杂feature交付新阶段

不止修bug:Agentic Coding评测走向复杂feature交付新阶段

在 Princeton 发布 SWE-Bench 之后,用真实世界代码仓库+可执行测试评测大模型软件工程能力,几乎已成为学术界与工业界的共识。围绕 SWE issue 的评测范式迅速发展,也催生了一系列 SWE 系列 benchmark,在刻画模型 bug 修复能力方面发挥了重要作用。

来自主题: AI技术研报
7801 点击    2026-03-04 13:44
当阿里入局全球 AI Coding,战场里的 60 天 | 对话叔同:Qoder 创始人

当阿里入局全球 AI Coding,战场里的 60 天 | 对话叔同:Qoder 创始人

当阿里入局全球 AI Coding,战场里的 60 天 | 对话叔同:Qoder 创始人

“很正确,无比正确” 当我们问起阿里巴巴 Qoder[1] (Agentic Coding 产品)创始人叔同,关于他带领团队冲入全球 AI Coding 这片“红海” 60 天后的感受时,他给出了这样简单而坚定的回答。他的底气,源自一份优秀的成绩单:上线 5 天用户迅速突破 10 万,仅 60 天斩获 50 万开发者用户。

来自主题: AI资讯
8739 点击    2025-10-30 12:40
「微调已死」再添筹码,谷歌扩展AI自我进化范式,成功经验与失败教训双向学习

「微调已死」再添筹码,谷歌扩展AI自我进化范式,成功经验与失败教训双向学习

「微调已死」再添筹码,谷歌扩展AI自我进化范式,成功经验与失败教训双向学习

这几天,关于「微调已死」的言论吸引了学术圈的广泛关注。一篇来自斯坦福大学、SambaNova、UC 伯克利的论文提出了一种名为 Agentic Context Engineering(智能体 / 主动式上下文工程)的技术,让语言模型无需微调也能实现自我提升!

来自主题: AI技术研报
8973 点击    2025-10-15 12:14
斯坦福最新:上下文只能写死在prompt里?用ACE把经验写进可演化上下文『附系统提示』

斯坦福最新:上下文只能写死在prompt里?用ACE把经验写进可演化上下文『附系统提示』

斯坦福最新:上下文只能写死在prompt里?用ACE把经验写进可演化上下文『附系统提示』

调模型不如“管上下文”。这篇文章基于 ACE(Agentic Context Engineering),把系统提示、运行记忆和证据做成可演化的 playbook,用“生成—反思—策展”三角色加差分更新,规避简化偏置与上下文塌缩。在 AppWorld 与金融基准上,ACE 相较强基线平均提升约 +10.6% 与 +8.6%,适配时延降至约 1/6(-86.9%),且在无标注监督场景依然有效。

来自主题: AI技术研报
10667 点击    2025-10-11 11:31
Kimi K2新模型来了!多项测试超Claude、审美超前代,免费可用

Kimi K2新模型来了!多项测试超Claude、审美超前代,免费可用

Kimi K2新模型来了!多项测试超Claude、审美超前代,免费可用

智东西9月5日消息,刚刚,大模型独角兽月之暗面发布新模型Kimi K2-0905,目前,Kimi应用和网页版中的K2模型已全量升级到Kimi K2-0905。该模型的核心升级点为Agentic Coding能力增强、支持256K上下文、API支持高达60-100Token/s的输出速度、支持Claude Code。

来自主题: AI资讯
10870 点击    2025-09-05 16:54
突发!OpenAI 30 亿美元收购案黄了,AI 编程明星公司被谷歌截胡

突发!OpenAI 30 亿美元收购案黄了,AI 编程明星公司被谷歌截胡

突发!OpenAI 30 亿美元收购案黄了,AI 编程明星公司被谷歌截胡

曾被 OpenAI 相中,开价 30 亿美元的 AI 编程初创公司 Windsurf,如今转身投奔了 Google。就在刚刚,Google 宣布将 Windsurf 部分高管及工程团队纳入其旗下的 DeepMind 团队,重点推进「代理式编码」(Agentic Coding)方向的研究。

来自主题: AI资讯
9531 点击    2025-07-12 09:53